指标$ k $-$ -center聚类是一个根本无人监督的学习原始。虽然广泛使用,但这种原语受到数据中噪声的严重影响,因此更明智的变体寻求最佳解决方案,这些解决方案忽略了数据集的给定数字$ Z $的Z $。我们为在滑动窗口设置下的流模型中提供有效的算法,在滑动窗口设置下,在每个时间步骤中,要群集的数据集是窗口$ W $的最新数据项。我们的算法达到$ O(1)$近似,显着要求在$ k + z $和logarithmic中以$ k + z $和logarithmic提供的工作内存线性。作为一个副产品,我们展示了如何估计窗口的有效直径$ W $,这是窗口点传播的衡量标准,忽略了给定的嘈杂距离的一部分。我们还提供了我们理论结果的实际可行性的实验证据。
translated by 谷歌翻译